ترکیب یادگیری تقویتی پیوسته و یادگیری باناظر برای ناوبری ربات
thesis
- وزارت علوم، تحقیقات و فناوری - دانشگاه یزد - دانشکده مهندسی برق و کامپیوتر
- author فاطمه فتحی نژاد
- adviser ولی درهمی مهدی رضاییان
- Number of pages: First 15 pages
- publication year 1391
abstract
استفاده از یادگیری باناظر در ناوبری ربات های متحرک، دارای چالش های جدّی همچون ناسازگاری داده ها، مشکل جمع آوری داده های آموزشی وخطای زیاد در این داده ها می باشد. لیکن استفاده از یادگیری تقویتی، که یک روش یادگیری تعاملی قدرتمند می باشد، مورد توجه واقع شد. از طرفی یادگیری تقویتی زمانبر بوده و دارای نرخ شکست های بالا در مرحله آموزش می باشد. از این رو در این پایان نامه، یک ایده جدید برای استفاده موثّر از هر دو الگوریتم یادگیری فوق ارائه می شود. یک کنترلگر فازی سوگنو مرتبه صفر با تعدادی عمل کاندید برای هر قاعده جهت تولید فرمان های کنترل ربات در نظر گرفته شده است، بطوریکه ساختار این کنترلگر با ساختار کنترلگر یادگیری سارسایِ فازی که یک الگوریتم آموزش تقویتی پیوسته می باشد، سازگاری دارد. هدف از آموزش تعیین عمل مناسب برای هر قاعده است. در مرحله اول داده آموزشی با حرکت ربات توسط ناظر در محیط جمع آوری می شود. سپس با بهره گیری از روش جدید ارائه شده، پارامترهای ارزش هر عمل کاندید در قواعد فازی با کمک داده های آموزشی مقداردهی اولیه می شوند. در مرحله دوم از الگوریتم سارسایِ فازی برای تنظیم دقیق تر پارامترهای تالی کنترلگر بصورت برخط استفاده می شود. نتایج شبیه سازی در شبیه ساز kiks برای ربات خپرا حاکی از بهبود قابل توجه در زمان یادگیری و کیفیت حرکت ربات می باشد.
similar resources
روشی نوین برای یادگیری تقویتی فازیِ باناظر برای ناوبری ربات
: استفاده از یادگیری باناظر در ناوبری ربات های متحرک، با چالش های جدی از قبیل ناسازگاری و اختلال در داده ها، مشکل جمع آوری نمودن داده آموزش و خطای زیاد در داده های آموزشی مواجه می باشد. قابلیت های یادگیری تقویتی همچون عدم نیاز به داده آموزشی و آموزش تنها با استفاده از یک معیار اسکالر راندمان باعث کاربرد آن در ناوبری ربات شده است. از طرفی یادگیری تقویتی زمانبر بوده و دارای نرخ شکست های بالا در م...
full textروشی نوین برای یادگیری تقویتی فازیِ باناظر برای ناوبری ربات
: استفاده از یادگیری باناظر در ناوبری ربات های متحرک، با چالش های جدی از قبیل ناسازگاری و اختلال در داده ها، مشکل جمع آوری نمودن داده آموزش و خطای زیاد در داده های آموزشی مواجه می باشد. قابلیت های یادگیری تقویتی همچون عدم نیاز به داده آموزشی و آموزش تنها با استفاده از یک معیار اسکالر راندمان باعث کاربرد آن در ناوبری ربات شده است. از طرفی یادگیری تقویتی زمانبر بوده و دارای نرخ شکست های بالا در م...
full textاستخراج ویژگی از دادههای عمق با استفاده از روش یادگیری عمیق برای کنترلِ باناظر ربات چرخدار
این مقاله چارچوبی از یادگیری عمیقِ با ناظر را جهت ناوبری ربات چرخدار در زمینهای هموار با محوریت وظایف پیگیری دیوار و اجتناب از موانع ارائه مینماید. در اینجا، فرض بر این است که ربات تنها به یک سیستم بینایی (دوربین کینکت) مجهز است. چالش اصلی در هنگام استفاده از تصاویر عمق، ابعاد بالای تصاویر و استخراج ویژگیهای مناسب از آنها با هدف کاهش ابعاد ورودی کنترلگر میباشد. برای این منظور در این مقاله...
full textیادگیری تقویتی برای ربات های فوتبالیست
مسئله ی فوتبال ربات ها یکی از سیستم های چندعاملی پیچیده است، از آن جایی که هدف اصلی مسابقه ی فوتبال گل زدن است برای یک عامل فوتبال ربات ها مهم است که یک تکنیک در مورد چگونگی به ثمر رساندن یک گل، داشته باشند. در این پایان نامه از الگوریتم بهینه سازی ازدحام ذرات مبتنی بر یادگیری تقویتی برای پیدا کردن بهترین مکان از دروازه برای شوت کردن توپ به سمت آن، استفاده شده است. تابع ارزیابی برای الگوریتم از...
توسعه ایده های یادگیری تقویتی گسسته در یادگیری تقویتی پیوسته برای سیستم های چند عامله
در جهان پیچیده امروز برای انجام کارهای متفاوت گاهی توانایی یک فرد کافی نیست و مشارکت و همکاری افراد نیاز است. در دنیای کامپیوتر نیز سیستم های چند عامله متشکل از تعدادی عامل است که با یکدیگر در یک محیط در تعاملند. این سیستم ها ویژگی های خاصی دارند، از جلمه خود مختاری، عدم دسترسی به اطلاعات سراسری و به اشتراک گذاری دانش. در این سیستم ها تغییرات محیط وابسته به ترکیب عمل تولید شده از همه عامل ها می...
15 صفحه اولطراحی و شبیه سازی ناوبری ربات سیاردر زمین های ناهموار با استفاده از الگوریتم یادگیری تقویتی
در این پایان نامه موضوع ناوبری ربات سیار در محیطی با موانع نرم مورد بررسی قرار گرفته است. در سالهای اخیر حرکت رباتهای سیار در محیطهایی که عبور از آنها ممکن اما همراه با هزینه است، نظر بسیاری از محققین را به خود جلب کرده است، به خاطر اینکه به طور گستردهای در رشتههای گوناگون از قبیل اکتشافات فضایی، نظارت زیرآبی، صنایع نظامی، کاربردهای پزشکی، نجات، و غیره استفاده شده است. برای این کاربردها ناو...
My Resources
document type: thesis
وزارت علوم، تحقیقات و فناوری - دانشگاه یزد - دانشکده مهندسی برق و کامپیوتر
Hosted on Doprax cloud platform doprax.com
copyright © 2015-2023